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一 种 考虑 到 不 同 物种 同 源 大 分 子 
间 的 偶合 关系 的 新 的 今 祖 法 


《中 国 科学 院 区 明 动 物 研 究 所 ) 


仿 相 法 可 以 在 建立 分 子 进 北 竺 时 避免 由 于 进化 速率 的 冀 异 而 造成 的 误差 。 但 是 在 实地 应 用 中 发 现 。 在 
理论 上 应 该 雁 在 的 一 些 等 式 关系 往往 并 不 存在 ， 俐 且 在 用 不 同 物种 的 同 源 大 分 子 作为 参 证 时 ， 往往 况 会 得 
到 各 不 相同 的 结果 。 作者 以 前 的 分 析 表明 ， 这 是 由 于 参 证 物种 与 被 研究 物种 同 源 大 分 子 之 间 的 不 同 程 度 的 
ARAGUUNA.EARIJRHERITONNOTE, UDC; | RES MORAN | , xin 


UR er, 在 此 DPC" i .4' i. i, EIS j - CO i x j GRE ZiEWRO, CO; Md" jj 与 
任意 选 定 的 一 个 基准 数 之 蓉 。 BH, 同时 也 就 避免 了 去 证 物种 与 被 研究 物种 同 源太 分 子 之 问 的 铀 全 关系 所 
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今 祖 法 (Present-Day Ancestor method, Klotz Blanken, 1981; Wen-Hsiung 
Li, 1981) 是 建立 分 子 进 化 树 的 一 种 方法 ， 其 基本 点 在 于 把 所 得 到 的 对 应 于 一 种 不 等 
速 进化 树 的 盖 蜡 和 矩阵， 改变 成 为 具有 相同 的 分 枝 型 式 (topology) 但 是 等 速 进 化 的 进化 树 
的 差异 矩阵 。 这 样 就 可 以 避免 出 于 进化 速度 不 等 在 成 聚 分析 上 所 造成 的 误差 。 但 是 在 实 
际 应 用 此 法 时 ， 却 往往 发 现实 际 情况 与 理论 上 的 推断 有 矛盾 。 从 理论 上 来 说 ， 用 位 于 所 
要 研究 的 进化 枝 之 外 的 任何 物种 作 参 证 ， 结 果 都 应 该 是 一 样 的 。 但 是 实际 上 ， 用 不 同 的 
物种 作为 参 证 ， 却 往往 会 得 到 各 不 相同 的 结果 ， 弄 得 人 莫衷一是 。 作 者 前 已 对 此 进行 了 
分 析 ， 措 出 这 是 由 于 在 不 同 的 参 证 物种 与 各 个 被 研究 物种 的 同 源 大 分 子 之 间 ， 不 仅 存在 
著 进 化 距离 土 的 关系 ， 而 且 还 存在 着 各 不 相同 的 偶合 关系 “李靖 炎 ，1988) 。 根 据 这 种 
认识 ， 作 者 提出 了 一 种 能 够 消除 偶合 所 造成 的 干扰 的 新 的 今 祖 法 。 本 文 报 道 了 此 方法 的 
构思 ， 论 证 及 初步 的 实际 应 用 。 但 首先 要 对 今 祖 法 的 原理 作 一 个 简介 。 
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今 祖 法 的 原理 


设 有 两 个 进化 枝 如 图 1 所 示 ， 都 是 不 等 速 进化 的 ， 因 此 从 始祖 六 至 A 一 DD 各 点 的 路 
离 是 不 等 的 ， 从 始祖 Y 至 P 一 S 各 点 的 距离 也 不 相等 。 设 AX- 一 DX 中 CX 为 最 短 ， 我 们 可 
ULFAAX@RCX, BXW&CX, CXXCX, DXPICKX, Mra, rm, ro, rpfEXitziEf, AX— 
DX 各 线段 分 别 减 去 rx、rp、ro、rp 就 变 成 相等 的 了 ， 亦 即 成 了 等 速 进化 的 。 但 我 们 对 x 
的 实际 情况 其 实 并 不 了 解 ， 因 此 也 就 无 法 加 以 利用 。 然 而 可 以 用 位 于 此 进化 枝 之 外 的 任 
一 现存 物种 〈《“ 今 祖 ? ) ， 例 如 p， 代 理工 作 为 参 证 ， 因 为 AP-CP- AX-CX= ru 
BP~CP=BX -CX=rg, CP-CP=CX-CX=rg=0,DP-CP=DX-CX=1ty, 为 了 形 
象 化 地 说 明 问题 , 可 以 根据 A -DD 至 X 的 距离 和 P 一 S 至 Y 的 距离 , 把 图 1 改 绘 成 图 2 i 
Wen-Hiung Li (1981) 的 方法 取 最 短 的 CQ 作为 基准 ， 从 AP. AQ, e DS 各 线段 中 减 
去 CQ， 结 果 等 于 以 XX 和 Y 作 为 圆心 ， 分 别 以 CX 和 QY 作 为 半径 ( 按 Klotz 与 Blanken 法 ， 





则 是 以 PA 一 D5 的 平均 值 作为 基准 ， 以 AX 一 DX 的 和 PY 一 SY 的 平均 值 作为 半径 ) ， 画 
PRM, SRRRMRFA, B COO. DN P' Q'CHIQ), R', Sae, AA 
BBY, CC'¢=0), DD', PP/,QQ'(z0), RR', SS' BÆRE ra fm. To. to. ir 
io. Ta. [go 从 各 线段 减 去 有 关 的 校正 值 ， 就 得 到 了 等 速 进 化 树 。 由 此 也 就 得 到 了 今 祖 
法 的 基本 公式 ; di = da-rei AMA dp (AP) ME (AA), BRB rp PY, W 


得 到 了 d' ,pCA'PD, . 
AB 2 中 可 以 看 到 A'P'=A'Q'= A'R'= A'R'= A'5'=B'P!= ,= D'S's CQ, zB 
d'APZd'AQ- es =d'DS=dCQ 这 种 等 式 关系 从 简单 的 计算 也 同样 可 以 看 到 ， 


r4=dAP-dCP = dAQ- dCQ = CAR - dCR = dAS - dCS 

tg = dBP - dCP = dBQ - dCQ = dBR ~ dCR - dBS - dCS 

rc = dCP - dCP = dCQ-dCQ = dCR - dCR =dCS-dCs = 0 
rp = dDP - dCP = dDQ - dCQ = dDR - dCR =dDS - CS 

rp = dÀP - dAQ =dBP-dBQ = dCP - dCQ = dDP - dDQ 
ra = dÀQ - dAQ = dBQ - dBQ = dCQ ~ dCQ = dDQ - dDQ = 9 
rr = QAR - dAQ = dBR - dBQ = dCR - dCQ = dDR - dDG 





* 
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ry = dAS - dAQ = dBS - dBQ = dCS - dCQ = dDS - dDQ 
d'AP-dAP-r4-rp-dAP -(dAP-dCP) - (dCP - dCQ» = dCQ 
d'AQsdAQ-r4- rgo =dAQ - (dAQ - dCQ) - (dCQ~ dCQ) - aCQ 
d'AR =dAR - ri- rg  dAR - dAR-dCR) - (dCR - dCQ» = dCQ 
d'ASsdAS- r4-7 rs =dAS - (d AS - dC5) - (dCS - dCQ) =dCQ 


d'BP -dBP-rg-rp-dBP - (dBP- dCP) ~ ACP - dCQ) - dCQ 


d'DS = dDS- rp- rs = dDS - «dDS - dCS) - (dCS - dCQ) = dCG: 


"^ d aP =d AQE AR ad AS rererere nu =d DS = dC 


Adi: Sc JE H BU A ES AR RRR 


在 应 用 今 福 法 于 实际 研究 时 ， 立 刻 就 会 发 现实 际 情况 并 不 象 上 面 Br ONE 的 那样 简 
单 。 实 际 上 ， 经 常 遇 到 的 情况 并 不 是 dAP -dCP=dAQ-dCQ=dAR-dCR=, 而 是 
dAP ~dCP#dAQ-dCQ4#dAR-dCRAw, 3h dAP=d'AQ=d'AR= +e =d'DS= 
dCQgE Be JAP ed AQ d'ARzz e ed'DS4dCQ, EXHI, LOE A—D 
间 的 进化 关系 时 ， 用 P 作 参 证 得 到 一 种 结果 ， 用 Q 作 参 证 时 往往 却 会 得 到 另 一 种 。 这 些 
都 是 与 上 面 的 理论 推断 完全 矛盾 的 。 

作者 以 前 的 分 析 表 明 ， 这 是 由 于 在 诸 被 研究 物种 与 参 证 物种 的 同 源 大 分 子 之 间 除 了 
有 进化 距离 的 关系 外 ， 还 存在 着 不 同 的 偶合 所 致 。 设 物种 i 与 i 的 某 种 同 源 大 分 子 间 的 
进化 距离 为 Di;， 其 间 的 偶合 关系 为 Cti;， 则 比较 两 种 大 分 子 序列 后 ， 实 际 得 到 的 差异 数 
将 不 是 D;;， 而 是 Dis 减 Ci;， 即 di;s。 如 果 从 矩阵 了 出发， 用 今 祖 法 是 可 以 得 到 理论 所 推断 
出 来 的 关系 的 ， 即 Dup= D ag= ttem D'ps = Dco。 然 而 实际 上 只 能 从 矩阵 d 出 发 。 
由 于 不 同 种 的 同 源 大 分 子 问 的 偶合 程度 并 不 一 致 ， 各 个 由 值 也 就 会 不 一 样 。 同 E 地 ， 
Dar- Dop = Dao- Dog = Dar- Dog= en 因此 (dap + Cap) - ort Cop) = (dag * 
Cag) - (deg + Ceg) = 5, iX RE UE dap- der) + (Car — Cop) = (dag 7 deo) + (Cao — 


Cog) =., Fill, ER dE Cap-Cop=Cug~Cog= t ( 这 是 不 可 能 的 ) ， 否 则 
(dap—dgp) a (dag- dog) os SERS SH, 
PATER T4] 7 
BEARD" p= Diag = D'age = D'os, W D'ar- daz, Diag -dao, «e D'pg ~ d'pg 
等 也 就 是 由 同一 个 数值 减法 由 4p、dso、dup…… 等 等 所 得 。 员 则 不 知道 这 个 数值 的 具体 


大 小 ， 但 是 可 以 任意 设 定 一 个 基准 数 来 代替 这 个 数值 。 设 这 个 基准 数 与 这 个 数值 之 差 为 
Q， 各 d5 数 与 这 个 基准 数 信 差 为 Da， 则 很 明显 ，D'o dB SP 9 加 CO, 于 是 
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D^4-0- d'a Ca, JE HABTED/BI ASA So KC SE — 个 数值 中 并 不 会 影响 由 此 
得 到 的 进化 桂 的 分 校 型式 ER ik AA AB B Cd? + CO). 出 发 也 同样 可 以 得 到 为 矩阵 D 所 代表 
的 正确 的 分 枝 型 式 。 

下 面 四 实例 加 以 说 明 。 根 据 图 1 中 的 进化 钳 ，A 一 与 一 $ 间 的 进化 距离 将 如 托 阵 
DAAG ADHS RA timik C 所 示 ， 则 实际 看 到 的 差异 数 将 如 矩阵 d 
Bim (dy = Da- i= AY B, C, Dj JP, QIR SD, 








D IP Q ROS... O- LPA- RoS o _d PQR 5 
A F 3l 41 38 Å A 34 30 38 31 
B 35 30 40 35 B B i 31 27 38 34 
C 34 29 39 34 C C | 31 26 35 28 
D 35 30 jð 35 p D 35 29 39 35 





te Wen-Hsiung Li(1981) 的 方法 消除 不 等 速 进化 的 影响 后 ，  MASEFEDERELT Me 
D’ (Dy = Du-R:-R;), 从 矩阵 d RB RC’ (Pi deari- r), SERED’ 与 矩阵 
Cl? fel ig a Se m REC! Pp aC’ gy = Dl la) 。 





2, 4 PQ R Ss G^ P Q R S5 d'! P Q R 5 
A | 29 29 29 29 A | 2.5 2,26 3.75 5.25 A 26.5 26.75 25.25 23.75 
B 29 29 29 29 B 4.75 4.5 8 1.5 B 24.25 24.5 26 27.6 
C | 28 20 29 29 b | 2.25 3 3.5 5 C 26.75 26 25.5 24 
D 29 29 29 29 D 4.25 4 8.5 8 D 24.75 25 25.5 27 


以 尾 一 数值 作为 基 淮 ， 例如 以 矩阵 由 中 的 最 大 数 27 .5 作为 基准 ， 从 矩阵 d' 就 得 到 了 
矩阵 CO 〔〈COi = 27.5 -do。 比 较 矩 阵 C 与 矩阵 CO， 可 见 其 间 有 一 个 极 简单 的 算术 关 
X, Hgx1.5.061.58]3E27.5 55 D/,2 25, DANO, AED’, 7 d';;2 Ci; = CO s+ Q, FE 
D’,,- Q=d’45+CO z= DO’ij。 这 也 就 是 说 。 MERE d^ 加 矩阵 LO 就 可 得 到 矩阵 DDO'， 
后 者 正好 等 于 矩阵 DD!' 减 9。 








QU] PrP Q R 5 C'-COlRP Q R S. deco). P Q_R S 
A 1 0.75 2.25 3.75 A E 1.5 1.5 1.5 A ja 27.6 27.5 27.5 
B [8.25 3 1.5 0 B 1.5 1.5 15 1.5 B 27.5 27.5 27.5 27.5 
C Inr 1.5 2 3.5 C ee 1,5. 1.5 L5 C (are 27.6 27.6 27.5 
D 12.75 2.5 2 0.3 D 1.5 1.5 1.5 15 D 27.5 27.5 27.5 27.5 


在 实际 工作 中 矩阵 D、 和 矩阵 D'、 伟 阵 C/ 以 及 吕 的 具体 数 信 全 都 是 不 知道 的 ， 但 是 只 
TAER d 得 到 矩阵 4/， 再 进而 得 知 矩 阵 CO， 景 后 得 到 矩阵 DO/， 也 就 可 以 得 知 为 矩阵 
D: 所 代表 的 正确 的 分 枝 型 式 。 | 

通过 上 面 的 具体 例证 ， 我 们 还 发 现 了 另外 的 可 供 利 用 的 关系 。 发 现 矩阵 (de CO 
虽 不 等 于 矩阵 D， 但 两 者 所 代表 的 分 枝 型 式 却 是 完全 相同 的， 因为 矩阵 Cd+C') 经 
Wen-Hsiung Li 法 处 理 后 所 得 到 的 底 阵 (+0 EFREM D’, AER (d+ C 
PMA Q, BEATER (d+ CO) ， BERE DO。 后 者 所 代表 的 分 枝 型 式 仍然 与 矩阵 
DAUR, BA% (de CO) BWen-Hsiung Li 法 处 理 后 所 得 到 的 朱 降 (Le CO) “正好 
就 是 矩阵 D' 减 2， 亦 即 矩阵 (+C, MERDO, 














HERE td *C' 3| P CM Q RkR 6$ s d+ Cha’ | P Q R S 
A H 5 32.25 41.75 36.25 A 29 29 29 29 
E 35.75 31.5 Al 25.5 B 29 29 29 29 
C His .25 29 38.5 33 C 29 29 29 29 
D 37.25 38 42.5 37 D 29 29 29 29 





P Q R S 2 (4 * CO. 








Co! ster PE 4+CO)’ | P Q R 

A E 30.75 49.25 34.75 A 27.5 27.5 27.5 27.5 
B 34.25 30 38.5 44 B | 27.5 27.5 27.5 27.5 
C ae ,73 27.3 37 ; 31.5 C | 27.5 27.5 27.5 27.5 
D 35.75 31.5 4l $5.5 D 27.5 27.8 27.5 27.6 


但 是 现在 的 问题 并 不 是 要 研究 i(= A 一 DD) Gj (= P 一 R) 间 的 关系 ， 而 是 要 以 
j 为 参 证 研究 i 内 部 的 关系 ， 即 需要 求 出 DO… :i, 的 数值。 


按照 今 祖 法 的 基本 公式 ,DO i, WF FDO, €, - RO RO, 
EREDO i =d; , * CO, 


RO: = DOs;- DOs , ;- (di it CO D 一 CFL PEE 
= (dipi de p (COL SOs ms ) 
= rg CO; j- CO; : 
a a mtn? 
RO, =rs, + CO ;- CO: ai 
DO’ iata = ds 4 + CO A E ri ra, 7 COfaj - COtps + 2COiming | 
du, *CO: n -CO; ;-COinit 200, i 
DO’; i, - CO, e -2C0.,  ;= d^; 4, 7 COs, ;- CÓ; ; = DC” iat 


a b & b min 
K—-P REM SAK PHD C PIT GI, 并 不 会 影响 它 所 代表 的 分 枝 型 式 ， 因 此 
可 以 用 矩阵 DC 来 代替 矩阵 DO'。 在 这 里 假定 CO: uo 是 接近 于 恒 定 的 。 
DC t i, = ds, 4, - Cre ~ COs,;) - Ce, -CO;, 4) -d', 4 -CO;,;- CO i 
CO; uo EGER BUE AR TRH, 因为 它 设想 A、B、C、D 之 间 基 本 上 不 存在 


偶合 ， 或 者 虽 有 个 合 但 偶合 的 程度 基本 上 没有 差别 。 这 可 能 是 对 的 ， 特 别 是 EAL B, 

C. D 的 进化 关系 比较 接近 时 ， 但 是 它 不 会 是 普遍 都 正确 的 。 然 而 无 论 如 何 ， 新 方法 比 
原来 的 今 祖 法 已 经 有 了 一 个 重大 的 改进 。 原 来 的 今 祖 法 实际 上 是 假定 侦 合 关系 ， 一 概 个 
存在 或 者 程度 完全 等 同 。 而 新 方法 至 少 是 承认 并 且 在 计算 中 考虑 到 了 参 证 物种 与 被 研究 


物种 同 源 大 分 子 之 间 不 同 程度 的 性 合 。 


` ny 
新 方法 的 实际 应 用 
仍 以 图 1 中 的 进化 树 及 其 差异 矩阵 为 例 。 
dia B CD UP HSE, 得 到 dx [A B C D 所 得 分 枝 型 式 为 ; 
ee MICE 
Tt p 1 BP t p= = 

Cji 9 — 7 dcp=3 rc-0 C17 9 — 6 B 
DIll 10 7 一 d pp = 33 cnet D | $ $8 5 一 A C D 


OTC TE METTI 
r 
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MA S fe A Bie M mal d'|A B C D 所 得 分 技 型 式 为 : 
das=3 ra=? A |— -27 1 
drugs tH" B | 一 3 -3 
dos =28 re=0 Cl7 3 — 0 A CB D 
dps-38$ Epal cee aren 


可 见 以 了 或 5 MSIE, RO MRR AB. 按 新 方法 进行 计算 则 情况 不 是 
如 此 ， 该 新 方法 ， 





得 到 oc’ | A B C D 所 得 分 枝 型 式 为 : 
APT — -0.25 5.25 2.25 
ined B | -0.2 C 

C= Ud 5 一 1.5 
COpp=2.78 izz 215 一 A BC D 
以 S 丁 为 参 证 时 ， 得 到 DCI A. B C D. gray d n A: 
COas-3.73 A "n -5.75 -0.25 -3.25 
COBS=0 B [-5.75 — -0.5 -3.5 
COos - 8.5 C | 238 ij. = es A BC D 
COps =9.5 D | -3.25 -3.5 -4 — 


两 个 DC' 和 矩阵 其 实 是 一 样 的 ， 只 是 每 个 元 素 都 相差 5.5 而 已 。 

我 们 在 研究 包括 五 种 纤毛 虫 在 内 的 15 种 原生 生物 的 5S rRNA 的 进化 关系 对， 已 经 
习 用 了 这 种 新 方法 。 为 了 消除 不 等 速 进化 在 成 聚 分 析 上 可 能 造成 的 误差 ， 一 共用 了 14 种 
彼此 相距 较 远 的 真 细菌 类 的 5S rRNA 作 为 参 证 。 为 消除 各 种 真 细菌 与 不 同 原生 生物 的 
SS iRNA 之 间 的 不 同 侦 合 关系 的 影响 , 进行 了 COzs 的 计算 ， 并 按照 DC's a esa, T 


CO, - CO o :的 公式 计算 了 各 个 DC’ 值 。 NU DC cab UR A ET 下 面 仅 以 五 种 


纤毛 虫 的 进化 关系 上 所 得 到 的 结果 作为 例证 ， 以 与 用 原 今 祖 法 所 得 到 的 结果 作 一 比较 。 

按照 原 今 祖 法 进行 计算 , 以 Clothridium 作为 参 证 时 , 所 得 到 的 五 种 纤毛 虫 53 TRNA 
的 进化 关系 为 ((((Bresslaua Paramoecium) Blepharisma) Euplotes) Tetrahymena), 
ae Streptomyces 作为 参 证 时 ， 所 得 结果 则 为 〈《((( Br Te) Pa) Ble) Eup) 或 
(Br Pa) To) Bic) Eup); 以 Mycoplasma 作为 参 证 则 得 到 ((((Br Pa) Te) Eup) 
Ble); 以 Anacystis 作为 参 证 时 得 到 的 则 基 Br Pa) Te) Ble) Eup)。 按 照 新 的 方法 
计算 ， 无 论 用 哪 一 种 真 细 菌 作 为 参 证 ， 所 得 到 的 结果 全 都 是 {(((Br Pa) To) Ble) Eup), 
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A NEW PRESENT-DAY ANCESTOR METHOD FOR 
CONSTRUCTING PHYLOGENETIC TREES TAKING ACCOUNT 
OF THE COINCIDENCE BETWEEN HOMOLOGOUS MOLECULES OF 
THE SPECIES BEING STUDIED AND OF THE REFERENCE 
SPECIES 


Li Jingyan 


(Laboratory of Evolutionary Cell Biology, Kunming Institute of Zoology, 


Academia Sinica, Kunming, Yunnan) 


For constructing phylogenetic trees from molecular sequence data, theorc- 
tically the present-day ancestor method makes corrections for unequal rates of 
evolution among lineages and yields the correct topology. However, in practice 
it was found that different topologies were often obtained when different species 
were used as references, The fact is contrary to the anticipation and to the 
principle about this method, The previous siudy of the author pointed out 
that the phenomenon was resulted from the different degrees of ihe coinciden- 
ces between the homologous molecules of various species being studied and of 


the species used as references, [n the light of this understanding the author 


proposes a new method that the matrix d^ in the original method ( d't,*, = 


= m ie : ， 7 ? Ld - : 
ds, (5. re) ds converted to mairix DC’, DC MET =d i,t, COs, ; 
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-CO j where j represents the molecule of the species used as reference, 


and various CO, ; display indirectly coincidences between iand je From matrix DC’ 
simple clu-ster analysis can give same and correct topology whichsoever 
species in other evolutionary branches is used as reference, The establishment, 


principle and practical applying of the new method are described, 


Key words: molecular evolution, phylogenetic tree, coincidence, 


Present-Day Ancestor method, 


